我们提出了带有核心注释的新语料库,俄罗斯核心语料库(Rucoco)。Rucoco的目的是获得大量注释的文本,同时保持高通道一致性。鲁科科(Rucoco)包含俄语的新闻文本,其中一部分是从头开始注释的,其余的机器生成的注释是由人类注释者完善的。我们的语料库的大小是一百万个单词,约有15万个提及。我们使语料库公开可用。
translated by 谷歌翻译
现代时间域的光度测验收集了许多天文学对象的观察结果,大规模调查的即将到来的时代将提供更多信息。大多数对象从未接受过光谱随访,这对于瞬态尤其至关重要。超新星。在这种情况下,观察到的光曲线可以提供负担得起的替代方案。时间序列被积极用于光度分类和表征,例如峰值和光度下降估计。但是,收集的时间序列是多维的,不规则地采样,包含异常值,并且没有明确定义的系统不确定性。机器学习方法有助于以最有效的方式从可用数据中提取有用的信息。我们考虑了基于神经网络的几种光曲线近似方法:多层感知,贝叶斯神经网络以及使流量正常化,以近似单光曲线观察。使用模拟的Parperc和Real Zwicky瞬态设施数据样本的测试表明,即使很少有观察值足以拟合网络并获得比其他最新方法更好的近似质量。我们表明,这项工作中描述的方法具有比高斯流程更快的计算复杂性和更快的工作速度。我们分析了旨在填补光曲线观察中空白的近似技术的性能,并表明使用适当的技术会提高峰值发现和超新星分类的准确性。此外,研究结果是在GitHub上可用的Fulu Python库中组织的,该库可以很容易地由社区使用。
translated by 谷歌翻译
由于天文学中的大数据实时处理,超新星的光度数据驱动分类成为挑战。最近的研究表明,基于各种机器学习模型的解决方案质量卓越。这些模型学会使用其光曲线作为输入来对超新星类型进行分类。预处理这些曲线是一个关键的步骤,严重影响最终质量。在本次演讲中,我们研究了多层感知器(MLP),贝叶斯神经网络(BNN)的应用,并将流动(NF)归一化为单个光曲线的观测值。我们将这些近似值用作超新星分类模型的输入,并证明所提出的方法的表现优于基于适用于ZWICKY瞬态设施的亮点的高斯工艺的最新方法。 MLP表现出与高斯工艺相似的质量和速度增加。就近似质量而言,标准化流量也超过了高斯过程。
translated by 谷歌翻译
该论文着重于无人机的异质群,以实现移动机器人上层的动态着陆。科学家尚未实现这项具有挑战性的任务。关键技术是,我们没有用计算机视觉来促进无人机群的每个代理,这大大增加了有效载荷并缩短飞行时间,而是建议在领导者无人机上仅安装一台摄像头。追随者无人机从无人机中接收命令,并保持无冲突的轨迹。实验结果表明,群体降落在静态移动平台上(4.48厘米的RMSE)上很高。 RMSE群落在移动平台上的降落,最大速度为1.0 m/s和1.5 m/s,分别为8.76厘米和8.98厘米。拟议的蜂群技术将允许蜂群的省时降落,以进一步充电。这将使可以在救援操作,检查和维护,自主仓库库存,货物交付等方面实现多代理机器人系统的自我维护操作。
translated by 谷歌翻译
由于Jacot等人的著名结果,神经切线内核(NTK)被广泛用于分析过多散热性神经网络。 (2018):在无限宽度限制中,NTK在训练过程中是确定性和恒定的。但是,该结果无法解释深网的行为,因为如果深度和宽度同时无穷大,通常不会成立。在本文中,我们研究了与宽度相当的深度连接的Relu网络的NTK。我们证明NTK性质显着取决于初始化时的深度与宽度比和参数的分布。实际上,我们的结果表明,在Poole等人中确定的超参数空间中这三个阶段的重要性。 (2016年):订购,混乱和混乱的边缘(EOC)。我们在所有三个阶段中都在无限深度和宽度极限中得出NTK分散剂的精确表达式,并得出结论,NTK的可变性在EOC和混乱阶段随着深度而呈指数增长,但在有序阶段中却没有。我们还表明,深网的NTK只能在有序阶段训练期间保持恒定,并讨论NTK矩阵的结构在训练过程中如何变化。
translated by 谷歌翻译
我们呈现Turbo-SIM,是可以用作生成模型的信息理论原理的广义自动统计学框架。通过最大化输入和编码器和解码器的输出之间的相互信息,我们能够重新发现通常在对手自身额外的损失术语和生成的对抗网络中发现的损失术语,以及各种更复杂的相关模型。我们的广义框架使这些模型在数学上解释,通过分别设置每个损失项的重量来允许新的新功能。该框架还与编码器的内在架构和解码器无关,因此为整个网络的构建块留下了广泛的选择。我们将Turbo-SIM应用于碰撞机物理生成问题:在实验中检测到检测后,在碰撞之后,在碰撞之后的理论空间,在观察空间之后,从理论空间转换几个粒子的性质。
translated by 谷歌翻译
条件生成是生成问题的子类,其中生成的输出由属性信息调节。在本文中,我们提出了一种随机对比条件生成的对抗网络(InfoSCC-GaN),具有易诺的潜在空间。 InfoSCC-GaN架构基于内置于Infonce Paradigm的无监督对比编码器,属性分类器和Eigengan生成器。我们提出了一种新颖的训练方法,基于每次$ N $第-th迭代的外部或内部属性使用外部或内部属性,使用预先培训的对比编码器和预先训练的分类器。基于输入数据和潜在空间表示之间的相互信息最大化以及潜在空间和生成的数据来导出所提出的INFOSCC-GAN。因此,我们展示了训练目标函数与上述信息理论制剂之间的联系。实验结果表明,InfoSCC-GaN在AFHQ和Celeba数据集上的图像生成中优于“vanilla”Eigengan。此外,我们通过进行消融研究调查鉴别员架构和损失功能的影响。最后,我们证明,由于eigengan发电机,所提出的框架与Vanilla确定性GAN相比,与现有框架相比,与Vanilla确定性GAN相比,与Vanilla确定性GAN相反。代码,实验结果和演示可在HTTPS://github.com/vkinakh/infoscc-在线提供。
translated by 谷歌翻译
不连续分布的生成是大多数已知框架的困难任务,例如生成的自动化器和生成的对抗网络。生成的非可逆模型无法准确地生成此类分布,需要长期训练,并且经常受模式崩溃。变形AutoEncoders(VAES),基于保持潜在空间的想法是为了简单的采样,允许准确的重建,同时在生成任务中遇到重大限制。在这项工作中,我们使用预先训练的对比编码器来获得聚类潜空间来保持潜在的空间。然后,对于每个群集表示单向子多种子区,我们训练专用的低复杂性网络以从高斯分布生成该子多种。所提出的框架基于输入数据和潜在空间表示之间的相互信息最大化的信息定理制定。我们派生了成本函数与信息理论制定之间的联系。我们将我们的方法应用于合成2D分布,以展示使用连续随机网络的重建和产生不连续分布的方法。
translated by 谷歌翻译
贝叶斯神经网络与高斯过程之间的联系在过去几年中获得了很多关注,其中隐藏的单位在层宽趋于无穷大时收敛到高斯过程限制。支撑此结果是隐藏单元在无限宽度限制中变得独立。我们的宗旨是在实际有限宽度贝叶斯神经网络中阐明隐藏的单位依赖性质。除了理论结果之外,我们除了对隐藏的单位依赖性属性的深度和宽度影响。
translated by 谷歌翻译